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摘 要 : 本 文 创新 性 地 提出 了 一 种 利用 图 像 深度 学 习 解 决 无 线 电信 号 识别 问题 的 技术 思路 : 首先 把 无 线 电信 号 具象 
化 为 一 张 二 维 图 片 , 将 无 线 电信 和 号 识别 问题 转化 为 图 像 识别 领域 的 目标 检测 问题 ; 进而 充分 利用 人 工 智能 在 图 像 识 

别 领域 的 先进 成 果 ， 提 高 无 线 电信 号 识别 的 智能 化 水 平和 复杂 电磁 环境 下 的 识别 能 力 。 基 于 该 思路 ， 本 文 提出 了 

种 基于 图 像 深 度 学 习 的 无 线 电信 号 识别 算法 RadioImageDet 算法 。 试 验 结果 表明 , 该 算法 能 有 效 识别 无 线 电 信 
写 的 波形 类 型 和 时 / 频 坐 标 ， 在 实地 采集 的 12 种 、4740 个 样本 的 数据 集中 ， 识 别 准确 度 达到 86.03%，mAP 值 
到 77.72， 检 测 时 间 在 中 等 配置 的 桌面 计算 机 上 仅 需 33 毫秒 ， 充 分 验证 了 思路 的 可 行 性 和 算法 的 有 效 性 。 
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Radio Signal Recognition Based on Image Deep Learning 


ZHOU Xin” HE Xiaoxin ZHENG Changwen 
(Science & Technology on Integrated Information System Laboratory, 
Institute of Software Chinese Academy of Sciences, Beijing 100190, China) 
Abstract: This paper innovatively proposes a technical idea that uses image deep learning to solve the problem of 
radio signal recognition: first, it transforms the radio signal into a two-dimensional picture, and transforms the 
radio signal recognition problem into the object detection problem in the field of image recognition; then, it makes 
use of the advanced achievements about image recognition to improve the intelligence and ability of radio signal 
recognition in complex electromagnetic environment. Based on this idea, a novel radio signal recognition algorithm 
named RadioImageDet is proposed in this paper. The experimental results show that the algorithm can effectively 
identify the waveform types and time/frequency coordinates of radio signals. After training and testing on the 


self-collected data set with 12 types and 4740 samples, the accuracy reaches 86.03% and the mAP value reaches 


77.72, while the detection time is only 33 milliseconds on the medium configured desktop computer. 


Key words: Radio Signal Recognition; Deep Learning; Radio Frequency Machine Leaning (RFML); Convolutional 
Neural Network (CNN); Image Object Detection 
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1 引 


近年 来 ， 随 着 无 线 通 信 技 术 的 发 展 ， 特 别 是 物 联 网 的 兴起 ,无线电 波 已 经 成 为 连通 万 物 的 重要 载体 。 然 
而 ,无 线 电波 开放 性 的 特点 ,使 其 容易 受到 干扰 和 非法 利用 ， 导 致 正常 通信 系统 受 扰 甚至 中 断 ， 威胁 社会 和 
国家 安全 。 因 此 , 加 强 无 线 电 监测 与 识别 , 特别 是 在 机 场 、 边 境 等 重点 区 域 以 及 重大 活动 现场 的 无 线 电 监管 
具有 重要 的 现实 意义 和 迫切 需求 。 
无 线 电 信号 识别 技术 最 初 主要 用 于 军事 电子 战 和 政府 频谱 监管 领域 ， 随 着 近年 来 频谱 共享 需求 的 提升 
和 认 知 无 线 电 技术 的 发 展 ， 又 逐渐 成 为 商业 通信 和 领域 关注 的 焦点 出。 早期 的 无 线 电信 号 识别 ， 是 利用 各 种 频 
en 言 号 ， 经 过 处 理 后 ， 以 频谱 图 、 瀑 布 图 、 余 上 晖 图 等 可 视 化 方式 展现 出 来 ， 然 后 由 专 
人 员 分 析 信 号 时 频 特征 并 寻找 目标 信号 予 。 这 种 做 法 对 操作 人 员 的 专业 素质 要 求 非常 高 ， 而 且 当 监测 时 间 
0 言 号 较 多 时 ， 人 工分 析 效 率 和 准确 率 也 会 大 幅 下 降 。 
本 研究 由 国防 科技 创新 特区 基金 资助 (编号: 17-163-11-ZT-003-019-01) 
“通信 作者 : 周 讲 ”email 地 址 : zhouxin@iscas.ac.cn 
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目前 比较 流行 的 无 线 电信 号 识别 方式 , 是 先 由 本 领域 专家 精心 挑选 信号 关键 特征 , 如 功率 谱 密度 最 大 值 
引 、 信 号 包 络 峭 度 自 、 瞬 时 相位 标准 差 申 、 相 位 脉冲 个 数 自 、 循 环 谱 外、 高 阶 矩 时 等 时 / 频 / 谱 域 信号 特征 ， 然 
后 利用 传统 的 信号 处 理 算法 计算 特征 参数 值 , 最 后 再 基于 固定 规则 或 者 机 器 学 习 的 方法 进行 分 类 上 0。 通常 ， 
一 个 模型 需要 8 选取 其 中 的 几 项 甚至 十 几 项 特征 作为 模型 输入 ， 计 算 复 杂 度 非常 高 ， 很 难 实际 部 署 使 用 。 同 
时 ， 受 信号 波形 多 样 性 和 多 径 衰落 效应 的 影响 ， 该 方法 在 特征 选择 和 判决 准则 方面 也 缺乏 普 适 性 。 

众所周知 ,人工 智 能 在 模式 识别 任务 中 具有 独特 优势 , 近年 来 在 图 像 /语音 识别 、 自 然 语 言 处 理 、 医 疗 、 
金融 等 很 多 领域 取得 了 令 人 震惊 的 成 就 ， 引 起 了 社会 各 界 的 热切 关注 。 无 线 电信 和 号 识别 ,本质 上 也 是 一 种 特 
殊 的 “模式 识别 ” 因此 我 们 认为 ， 可 以 将 人 工 智 能 与 传统 无 线 电 信号 识别 技术 深度 融合 ， 利 用 人 工 智 能 的 
机 器 学 习 方 法 , 特别 是 深度 学 习 算 法 ,自动 提取 无 线 电波 的 模式 特征 ,避免 基 于 经 验 的 人 工 特征 提取 环节 ， 
提高 复杂 电磁 环境 下 无 线 电信 号 的 识别 能 

基于 这 一 设想 ， 本 研究 创新 性 地 提出 一 种 利用 图 像 深度 学 习 方 法 解决 无 线 电 信号 识别 问题 的 技术 思路 : 
首先 把 无 线 电信 号 具象 化 为 一 张 二 维 图 片 , 将 无 线 电信 号 识别 问题 转化 为 图 像 识别 领域 的 目标 检测 问题 ; 进 
而 充分 利用 人 工 智能 在 图 像 识别 领域 的 先进 成 果 ， 提 高 无 线 电 信号 识别 的 智能 化 水 平和 复杂 电磁 环境 下 的 
识别 能 力 。 基 于 该 思路 ， 本 文 提出 了 一 种 基于 图 像 深度 学 习 的 无 线 电 信号 识别 算法 RadioImageDet 算 


二 法 ， 并 通过 实物 系统 试验 ， 验 证 了 思路 的 可 行 性 和 算法 的 有 效 性 。 

2 相关 研究 工作 

S 早 在 上 世纪 九 十 年 代 ， 传 统 机 器 学 习 算法 ， 如 朴素 贝 叶 斯 、 神 经 网 络 、 决 策 树 等 ， 就 已 经 在 无 线 电 调制 
@ 识别 领域 中 得 到 了 应 用 呈 24。 但 受 限于 当时 的 技术 发 展 水 平 ， 仅 仅 是 利用 机 器 学 习 算法 ， 根 据 人 工 提取 出 的 
加 。 信号 特征 进行 分 类 ， 具 体 如 图 1 所 示 。 


人 工 特 征 选择 


输入 
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图 1 传统 基于 机 器 学 习 的 无 线 电信 号 识别 流程 

近 两 年 ， 随 着 计算 机 技术 和 深度 神经 网 络 技术 的 飞速 发 展 ， 这 一 现状 被 逐渐 打破 。2016 年 ， 受 到 深度 
神经 网 络 在 图 像 识 别 领域 巨大 成 功 的 鼓舞 ，O'shea 及 其 团队 连续 发 表 多 篇 论文 ， 研 究 深 度 学 习 技术 在 无 线 
电 通 信和 与 识别 领域 应 用 的 方法 与 问题 吴 阅 , 开启 了 无 线 电 识别 从 经 验 驱 动 的 人 造 特征 范式 到 数据 驱动 的 表示 
学 习 范式 的 新 纪元 。 同 年 ， 美 国 国防 先进 研究 项 目 局 (DARPA) 宣布 ， 将 于 2017 年 启动 SC2 挑战 赛 (The 
Spectrum Collaboration Challenge， 频 谱 协作 挑战 )， 旨 在 “将 先进 的 机 器 学 习 能 力 应 用 于 无 线 电 领域 ， 优 
化 频谱 使 用 策略 ， 以 缓解 电磁 频谱 拥挤 状态 ” 中。 这 是 本 世纪 DARPA 组 织 的 第 三 次 挑战 赛 ， 前 两 次 分 别 是 
21 世纪 初 的 自动 化 月 球 探测 器 挑战 赛 ， 以 及 2015 年 的 机 器 人 挑战 赛 。 
2017 年 ， DARPA 又 频频 出 手 , 推动 AI(Artificial Intelligence ) 与 无 线 电 的 融合 。2017 年 3 月 DARPA 
借助 认 知 无 线 电 领域 的 著名 学 术 会 议 一 一 DySPAN 会 议 ， 组 织 了 一 场 “ModRec” 竞 赛 ， 要求 各 挑战 者 识别 
会 议 现场 随机 生成 的 20 多 种 不 同调 制 方式 的 信号 波形 ， 并 声称 “这 是 以 更 高 效 的 方式 管理 电磁 频谱 的 第 一 
步 ”。8 月 ，DARPA 又 启动 了 “射频 机 器 学 习 系 统 ”(RFMLS) 项 目 。 作 为 SC2 项 目的 补充 ，RFMLS 项 
旨 在 “建立 一 种 射频 鉴别 能 力 ， 能 够 从 信号 嘲 杂 聚集 的 频谱 中 分 辨 出 独特 和 特殊 的 信号 ”上 叫 ， 未 来 将 用 于 
民用 和 军事 领域 。 

下 面 从 三 个 方面 介绍 与 本 研究 相关 的 研究 工作 。 
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2.1 基于 CNN 的 调制 方式 识别 
O’shea 在 文献 [15] 中 ， 提 出 了 一 种 基于 端 到 端 CNN 的 调试 方式 识别 模型 。 该 模型 以 时 域 I/Q 采样 为 输 
入 , 经 过 两 层 卷 积 层 和 两 层 全 链接 层 处 理 , 输出 信号 的 调制 方式 , 具体 结构 如 表 1 所 示 。 论文 利用 GnuRadio 


仿真 生成 了 11 种 不 同调 制 方式 的 信号 ， 作 为 训练 和 测试 数据 。 通 过 与 朴素 贝 叶 斯 、 开 近邻 、 决 策 树 、 多 
感知 机 、 支 持 向 量 机 等 传统 机 器 学 习 方法 进行 对 比 ， 发 现 新 算法 与 传统 算法 的 最 佳 性 能 相当 《传统 算法 采 
以 循环 矩 为 基础 构造 的 32 个 特征 作为 算法 和 输入)， 证 明了 端 到 端 CNN 用 于 自动 调制 识别 的 有 效 性 。 


于 汕 


表 1 O’Shea 模型 结构 


网 络 层 类 型 输入 尺寸 参数 激活 函数 
Conv 层 128X2 3X1 卷 积 核 ReLU 
256 个 特征 映射 
Dropout 50% 
Conrv 层 256X126X2 3X2 卷 积 核 ReLU 


80 个 特征 映射 
Dropout 50% 
Dense 层 9920X1 256 个 神经 元 ReLU 


Dropout 50% 
i Dense 层 256X1 11 个 神经 元 softmax 


在 此 基础 上 , 文献 [20] 采 用 分 层 识 别 的 方法 进行 改进 , 即 先 用 一 个 CNN 网 络 区 分 模拟 调制 和 数字 调 秆 
然后 在 该 先 验 知识 基础 上 ， 再 用 一 个 CNN 网 络 识别 具体 的 调制 类 型 ， 最 后 再 用 一 个 CNN 网 络 识别 调制 的 
阶 数 。 文 献 [21-22] 从 网 络 结构 的 角度 进行 改进 ， 在 CNN 网 络 基础 上 ， 增 加 了 时 序 特 征 的 考虑 ， 采 用 
CNN-+LSTM 的 网 络 结 构 进 行 调制 方式 识别 。 文 献 23] 在 O’shea 模型 的 基础 上 ， 在 全 连接 层 之 前 增加 了 一 
些 边缘 信息 《〈 即 传统 的 循环 平稳 特征 参数 ) 作为 输入 ， 用 于 辅助 CNN 识别 。 该 方法 据 弃 了 完全 以 原始 信息 
作为 模型 输入 的 前 提 条 件 ， 将 传统 基于 机 器 学 习 的 自动 调试 识别 方法 与 新 型 的 CNN 网 络 结合 ， 虽 然 提 高 

识别 准确 率 ， 但 遗留 了 很 强 的 专家 系统 印记 ， 且 计算 复杂 度 较 高 。 
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< 2.2 无 线 电 个 体 识别 
二 文献 [15, 20-23] 均 属于 调制 方式 识别 (Modulation Recognition )， 其 输出 需要 再 次 联合 其 它 信息 ， 才 能 
NN 形成 对 电子 侦察 、 频 谱 监 管 等 应 用 有 直接 作用 的 结果 ; 而 文献 24-27] 则 属于 更 高 一 层 的 无 线 电 个 体 识别 
(Radio Individual Identification), 其 结果 可 直接 用 于 上 述 应 用 场景 , 因此 更 加 符合 “ 端 到 端 ” 识 别 的 理念 。 
r= 文献 [24] 利 用 信号 矩阵 的 次 要 特征 值 区 分 信号 ， 通 过 和 矩阵 特征 值 求解 法 进行 无 线 电 信号 识别 。 文 献 [25] 
《9) 利用 物理 波形 和 射频 器 件 的 非 线 性 杂 散 发 射 特征 区 分 信号 发 射 源 ， 并 用 相位 空间 重 构 法 (RPS) 进行 分 析 识 
别 。 文 献 [26] 利 用 信号 功率 谱 密 度 (PSD ) 的 相似 性 区 分 信号 ， 并 采用 基于 神经 模糊 (neuro-fuzzy) 的 相似 
度 测量 方法 进行 分 析 识 别 。 以 上 文献 均 属于 传统 的 基于 专家 系统 的 无 线 电 识别 方法 ， 而 Schmidt 在 文献 [27] 
中 提出 了 一 种 基于 CNN 的 无 线 电 通 信 标 准 识别 模型 ， 该 模型 结构 与 O'Shea 模型 相似 ， 但 却 以 频 域 快 速 傅 
里 叶 变 换 (FFT) 变换 结果 为 输入 ， 直 接 输 出 无 线 电 通信 标准 名 称 ， 原 文中 涉及 802.11、802.15.1、802.15.4 
三 种 通信 标准 。 文 献 [28] 也 采用 类 似 的 CNN 网 络 , 但 是 以 Choi-Williams 时 频 分 布 (CWD) 变换 结果 作为 
模型 输入 ， 用 于 识别 线性 调频 (LFM)、Frank 序列 、Costas 人 码 等 8 种 常见 雷达 波形 。 本 研究 也 属于 无 线 电 
个 体 识别 ， 其 输入 为 包含 时 / 频 信 息 的 频谱 瀑布 图 ， 输 出 为 信号 的 波形 名 称 及 其 时 / 频 坐 标 。 


2.3 基于 深度 学 习 的 图 像 目标 检测 

图 像 目 标 检测 的 任务 就 是 找 出 图 像 中 所 有 感 兴趣 的 物体 , 并 确定 他 们 的 位 置 和 大 小 , 是 计算 机 视觉 领域 
的 核心 问题 之 一 。2013 年 以 前 ， 以 DPM (多 尺度 形变 部 件 模 型 ) 为 代表 的 传统 目标 检测 方法 一 直 处 于 强势 
地 位 。2014 年 ，R. Girshick 提出 了 R-CNN (Region proposal CNN ) 算法 框架 中， 使 得 目标 检测 的 准确 率 
取得 巨大 突破 ， 并 开启 了 基于 深度 学 习 的 目标 检测 的 研究 热潮 。 随 后 ，Fast R-CNNE0，Faster R-CNNEH， 
FPNB, YOLOv2B, SSD 了 等 一 系列 研究 成 果 纷 纷 涌现 ， 在 检测 速度 、 检 测 准 确 率 等 方面 均 有 较 大 提高 。 目 
前 ， 基 于 深度 学 习 的 图 像 目 标 检 测 主要 分 为 两 类 : 一 类 是 以 R-CNN、Faster R-CNN 为 代表 的 基于 区 域 提 


取 (region proposal) 的 目标 检测 算法 ， 另 一 类 是 以 YOLOv2、SSD 为 代表 的 基于 回归 问题 的 端 到 端 目标 检 
测算 法 。 由 于 前 者 需要 把 检测 过 程 分 为 区 域 提取 和 检测 分 类 两 步 , 而 后 者 直接 在 一 个 卷 积 网 络 中 实现 目标 的 
定位 和 识别 ， 简 化 了 网 络 结构 ， 在 保证 准确 率 的 前 提 下 ， 检 测速 度 达到 了 实时 检测 任务 的 要 求 ， 因此， 本 研 
究 将 以 YOLOv2 为 基础 ， 设 计 无 线 电 信号 识别 模型 。 


3 RadioImageDet 算法 模型 设计 


本 文 提出 了 一 种 基于 图 像 深 度 学 习 的 无 线 电 信号 识别 算法 RadioImageDet 算法 。 该 算法 基于 一 种 
端 到 端 卷 积 神经 网 络 , 能 够 在 时 / 频 混 芭 的 复杂 电磁 环境 下 , 同时 识别 出 环境 中 存在 的 多 个 信号 的 波形 类 型 ， 
并 可 定位 出 各 自 的 起 止 时 间 和 频率 范围 ， 其 算法 结构 如 图 2 所 示 。 

RadioImageDet 算法 由 预 处 理 模块 和 端 到 端 目标 检测 模块 两 部 分 组 成 。 预 处 理 模块 以 观察 窗口 的 原始 
I/Q 采样 数据 为 输入 ， 经 过 离散 傅 里 叶 变 换 (DFT)， 将 时 域 数 据 转 变 成 更 易 识 别 的 频 域 表 达 ;， 再 经 过 数据 
图 像 化 处 理 ， 将 连续 多 次 DFT 的 结果 组 合成 一 张 二 维 频谱 瀑布 图 。 端 到 端 目标 检测 模块 以 预 处 理 所 得 的 频 
谱 瀑布 图 为 输入 ， 经 过 CNN 特征 提取 层 ， 获 取 有 具象 化 的 信号 特征 ;再 经 过 目标 检测 层 ， 将 抽象 的 特征 转化 
为 信号 波形 类 型 、 时 / 频 坐 标 等 有 确定 含义 的 输出 结果 。 
~y 预 处 理 端 到 端 目标 检测 


原始 Vo 采 | | 频谱 | | 输出 「 信 和 号 名 称 “| 时 频 坐 标 ”| 
样 数据 流 | | brT 变 数据 图 | 1 瀑布 图 狼 | CNN 特 目标 检 | 结果 [Siel | ut | 
| 换 像 化 [三 T Ea 测 层 pp |Sie_2 | tL,f1,02,f2]; 
1 1 a | | 
| | | | Sig_m [t1,f1,t2,f2]m 
! | 上 


图 2 RadioImageDet 算法 结构 图 


3.1 预 处 理 模块 

RadioImageDet 算法 运行 ， 首 先 要 进行 数据 预 处 理 。 预 处 理 的 目的 ， 是 为 了 将 原始 I/Q 采样 数据 变换 
为 一 种 更 有 利于 自动 特征 提取 和 识别 的 表达 形式 。 为 了 充分 发 挥 卷 积 神经 网 络 在 特征 提取 方面 的 优势 , 并 降 
低 计 算 复 杂 度 , 我 们 希望 预 处 理 过 程 是 无 损 且 容易 计算 的 。 根据 离散 信号 处 理 理论 和 现代 通信 系统 原理 , 原 
始 的 I/Q 采样 数据 就 是 数字 通信 系统 后 端 处 理 的 基本 输入 ， 任 何 复 杂 的 数字 信号 处 理 算法 都 是 在 此 基础 上 
经 过 数学 变换 完成 ， 因 此 它 天 然 强 售 了 无 损 信息 。 这 也 是 O'shea 等 人 直接 选用 I/Q 采样 数据 作为 神经 网 络 
= 输入 的 原因 号 ' 习 。 从 数学 上 讲 ,离散 傅 里 叶 变 换 (DFT) 是 对 有 限 长 1/Q 采样 数据 的 无 损 变 换 ， 如 公式 (1) 
:三 所 示 , 同时 DFT 变换 的 结果 作为 信号 的 频 域 表达 形式 , 更 有 利于 以 电磁 辐射 为 基础 的 无 线 电 信号 的 识别 叶 。 
0 因此 ， 本 文 首先 对 原始 1/Q 采样 数据 进行 DFT 变换 ， 得 到 信号 的 频 域 表 达 ， 然 后 再 进行 后 续 的 处 理 ， 这 与 
文献 [26, 27] 的 思路 一 致 。 


Mos 


N-l1 
DFT: X[K]= > Mnje ,k=0,1,...,N -1 


n=0 


(1) 
N-l1 

IDFT : xln]= > n=0,b...,N -1 
k=0 


一 次 DFT 运算 的 结果 是 一 个 一 维 复数 序列 ， 可 以 形象 地 认为 是 “一 条 线 ”， 它 表示 某 一 时 间 点 的 频谱 
密度 谱 。 但是， 无 线 电 信号 波形 总 是 随时 间 变 化 ， 仅 观察 一 个 “时 间 点 ”的 特征 很 难 准 确 识别 信号 ， 因 此 将 
连续 多 个 时 间 点 的 观测 结果 进行 堆 夺 组 合 ， 变 成 “一 个 面 ”， 就 可 以 同时 表达 时 域 和 频 域 的 信息 特征 ， 有 助 
于 提高 信号 识别 率 。 在 这 个 二 维 平面 中 ， 横 轴 表 示 频 率 ， 纵 轴 表 示 时 间 ， 元 素 值 就 是 DFT 变换 的 结果 值 。 
如 果 将 元 素 值 按 图 像 灰 度 值 进行 映射 ， 就 可 以 绘 出 一 张 可 视 化 的 图 片 ， 该 图 片 就 是 频谱 瀑布 图 ， 具 体 如 图 3 
所 示 。 因 此 ， 本 文 在 DFT 变换 之 后 ， 增 加 了 一 个 数据 图 像 化 处 理 过 程 ， 将 连续 多 组 DFT 变换 的 结果 组 合 
成 频谱 瀑布 图 的 格式 ， 增 加 单个 样本 的 时 域 信息 量 ， 便 于 后 续 卷 积 神经 网 络 的 处 理 和 信号 识别 。 
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离散 傅 里 叶 变 换 合成 频谱 瀑布 图 


图 3 频谱 瀑布 图 合成 示意 图 
理论 上 讲 ， 频 谱 瀑布 图 的 尺寸 为 MXNX2。 其 中 ，2 表示 图 片 为 两 个 通道 ， 分 别 为 I 通道 和 Q 通道 ; 
N 表示 离散 传 里 叶 变换 的 点 数 ，M 表示 一 张 频谱 瀑布 图 内 合并 的 离散 传 里 叶 变 换 结果 的 组 数 ， 其 大 小 反映 
了 一 个 样本 的 时 间 跨 度 ，M 值 越 大 ,表征 的 时 间 跨 度 越 长 ,计算 也 越 复 杂 。 为 了 方便 运算 ， 本文 作 以 下 三 个 
简化 操作 : 

1) 为 了 简化 图 像 转化 操作 ， 直 接 将 I/Q 两 通道 按 公 式 〈2) 合并 为 一 个 通道 , 合并 后 的 物理 含义 为 功率 


密度 (PSD); 
Sal (2) 
2) 为 了 利用 快速 傅 里 叶 变 换 (FFT) 算法 加 快运 算 速 度 , N 值 需 取 2 的 正 整 数 次 容 , 本 文中 取 N=512; 


3) 为 了 匹配 某 些 基于 CNN 的 图 像 目 标 检测 模型 ， 取 M = N, 构成 一 个 正方 形 图 片 。 
因此 ， 简 化 后 的 频谱 瀑布 图 尺寸 为 NxN， 其 中 对 为 2 的 正 整 数 次 究 。 


3.2 端 到 端 目标 检测 模块 

经 过 预 处 理 , 抽象 的 无 线 电 信和 号 被 具象 化 为 一 张 形象 的 二 维 图 片 , 接 下 来 就 要 对 该 图 片 进行 特征 提取 ， 
识别 出 图 片 中 存在 的 信号 及 其 位 置 。 这 项 工作 的 本 质 与 计算 机 视觉 中 的 目标 检测 任务 完全 相同 ， 所 不 同 的 
是 ， 该 图 片 是 无 线 电信 号 经 过 DFT 变换 后 合成 的 频谱 瀑布 图 ， 而 不 是 自然 界 中 的 图 片 。 由 于 输入 图 片 的 特 
殊 性 , 或 许 存在 更 加 合适 的 神经 网 络 结构 进行 识别 和 目标 检测 , 但 本 文 暂时 不 对 其 进行 深入 研究 , 仅 以 目前 
比较 流行 的 YOLOv2 模型 名 为 基础 , 通过 简单 参数 修改 , 构造 无 线 电 信号 识别 网 络 模型 , 称 为 RadioYOLO 
模型 。 

如 图 4 所 示 ，RadioYOLO 模型 结构 主要 参考 了 Inceptionvl 网 络 ， 仅 使 用 3X3 和 1X1 卷 积 核 尽力 压 
缩 模型 参数 量 , 并 在 每 次 池 化 操作 后 将 特征 通道 数 翻 倍 ， 以 尽量 保持 特征 的 完整 性 。 同时, 借鉴 Inceptionv2 
的 思想 ， 对 每 一 个 卷 积 层 的 输出 都 使 用 批 归 一 化 (Bath-Normalization〉 处理 ， 增 加 了 模型 的 鲁 棒 性 和 训练 
速度 ， 并 可 代替 dropout 防止 过 拟 合 ; 借鉴 ResNet 的 跳跃 连接 的 思想 ， 将 conv13 的 输出 整形 后 ， 直 接 与 
conv20 进行 通道 全 并， 共同 输出 给 下 一 层 ， 使 得 输出 层 能 够 保留 更 高 分 辩 率 的 特征 ， 并 降低 “梯度 消失 ” 
概率 ， 使 用 leakyReLU 非 线 性 激活 函数 ， 减 少 训练 中 神经 元 死亡 的 概率 。 


1280 1024 85 


128 WE Concatenate Conv Conv 
256+1024 3x3x1024 1x1x85 

t ‘a Maxpool ‘o Maxpool onv Maxp' 
512x512x1 3x3x32 2x2 3x3x64 2x2 3x3x128 2x2 


图 4 RadioYOLO 模型 结构 
与 YOLOv2 模型 相 比 ，RadioYOLO 的 主要 改动 包括 以 下 几 点 : 
1) 模型 输入 的 图 片 尺寸 : 根据 FFT 变换 的 尺寸 ， 将 输入 尺寸 改 为 512X512; 


2) 


3) 


归 一 化 锚 框 的 尺寸 : 根据 无 线 电 信号 的 公 
a) “0.015， 0.9): 匹配 窄带 持续 信号 
b) 《0.5， 0.9): 匹配 宽带 持续 信号 

c) “0.025， 0.05): 匹配 窄带 瞬时 信号 
dj) 《0.469， 0.01): 匹配 宽带 瞬时 信号 
e) 《0.469， 0.1): 匹配 宽带 瞬时 信号 


模型 输出 的 张 量 尺寸 : 根据 输入 尺寸 和 数据 集 特征 ， 推 导出 新 的 输出 


表 2 RadioYOLO 模型 结构 


共 特 征 ， 选 择 5 个 销 框 (width, height)， 分 别 是 : 


尺寸 为 16X16X85。 


(每 个 卷 积 层 均 作 批 归 一 化 处 理 和 leakyReLU 激活 ， 尺 寸 值 省 略 通道 数 ) 
层 名 称 输入 尺寸 尺寸 / 步 进 卷 积 核 数 
Convl 512X512 8X 3/1 32 

Maxpooll 512X512 2X2 / 2x2 A 
Conv2 256x256 B93 64 
Maxpool2 256x256 2X2 / 2x2 / 
Conv3 128x128 BKB 1x 128 
Conv4 128x128 1X1 /1x1l 64 
Conv5 128x128 93 128 
Maxpool3 128x128 2X2 /2x2 / 
Conv6 64x64 BX 3 ll 256 
Conv7 64x64 1X1 /1x1l 128 
Conv8 64x64 3P530/loal 256 
Maxpool4 64x64 2X2 /2x2 / 
Conv9 32x32 BX 30/ Tx 512 
Conv10 32x32 1X1/1xl1 256 
Conv1l1 32x32 31 512 
Conv12 32x32 1X1 /1x1l 256 
Conv13 32x32 是 全 区 512 
Maxpool5 32x32 2X2 /2x2 / 
Conv14 16X16 多 LL 1024 
Conv15 16 义 16 1X1 /1x1l 512 
Conv16 16X16 BX 30/ Tl 1024 
Conv17 16X16 1X1 /1x1l 512 
Conv18 16X16 司 闪 罗 让 人 1024 
Conv19 16x16 3X3 / 1x1 1024 
Conv20 16x16 B30 ll 1024 
32x32 
Conv21 (以 conv13 为 1X1/1x1 64 
输入 ) 
Reshapel 32232 | 256 
2x2 
16Xx16 
Concatenatedl ” (连接 conv20 / 1280 
和 reshapel) 
Conv22 16X16 950 1024 
Conv23 16Xx16 1X1 /1x1l 85 


如 表 2 所 示 ，RadioYOLO 包含 23 层 卷 积 层 和 5 层 池 化 层 ， 输 入 为 512X512X1 的 频谱 瀑布 图 ， 输 出 
为 16X16XK 的 张 量 ，K 的 取 值 如 公式 (3) 所 示 。 


K=anchor_num x(class _num+5) (3) 


其 中 ，anchor_num 表示 锚 框 (anchor) 的 个 数 ，class_num 表示 待 识别 信号 类 型 的 个 数 。 在 本 文 的 验证 试 
验 中 ，anchor_mnum=5，class_num= 二 12， 因 此 K=85。 

括号 内 的 5 表示 除了 信号 类 型 外 ， 还 有 5 个 维度 的 特征 参数 预测 值 [, 妈妈 如 杞 ， 分 别 体 现 信号 边框 
的 左上 点 化 标 (b,, b,))、 边 框 尺 寸 (5,, 5b) 和 置信 和 度 (con 有 。 为 了 提高 模型 训练 的 稳定 性 ，t 等 预测 值 不 是 真实 
值 ， 而 是 一 种 归 一 化 的 中 间 值 ， 它 们 与 真实 值 的 关系 满足 公式 (4)。 因 此 ,在 利用 神经 网 络 模型 得 到 预测 特 
征 张 量 后 ， 仍 需 通 过 公式 (4) 计算 得 到 最 终 的 真实 预测 值 ， 完 成 目标 检测 。 


b, = Sigmoid(t)+c, 
b, = Sigmoid(t,)+c, 


1 
b, = anchor, *e™ ,其 中 Sigmoid(x) = 


lt+e™ 


b, = anchor, *e"™ 


conf = Sigmoid(t, ) 


4 数据 集 构建 

4.1 数据 采集 

在 以 往 的 无 线 电 识别 研究 文献 中 , 无 线 电 数据 通常 来 自 于 仿真 系统 , 如 MATLAB 仿真 软件 、 GnuRadio 
仿真 软件 、 信 和 号 发 生 器 等 ， 在 实验 室 环境 下 ， 通 过 人 工 代 码 的 控制 ， 生 成 单一 的 或 混合 的 有 了 噪 信和 号 0517,2023， 
735。 这 种 方式 降低 了 数据 获取 和 预 处 理 的 难度 ， 方 便利 用 先 验 信息 进行 数据 标注 ， 进 而 完成 算法 的 验证 。 
但 是 ， 受 到 信道 衰落 、 时 钟 拌 动 、 未 知 辐射 源 、 接 收 机 射频 特性 等 复杂 因素 的 影响 ,仿真 数据 与 真实 环境 下 
的 电磁 环境 往往 存在 较 大 差异 ， 影 响 了 算法 的 真实 性 和 实用 性 。 

为 此 ， 本 研究 利用 Gnuradio+USRP 软件 无 线 电 平台 ， 开 发 了 一 套 高 速 频谱 采集 系统 ， 用 于 采集 真实 
环境 下 的 频谱 数据 ， 如 图 5 所 示 。USRP 设备 是 由 美国 NI 公司 设计 并 生产 的 一 球 开 源 软件 无 线 电 模 块 ， 采 
用 AD9361 射频 集成 芯片 方案 ， 工 作 频 段 可 履 盖 70MHz~6GHz。Gnuradio 是 一 个 开源 软件 ， 利 用 普通 计 
算 机 实现 调制 / 解 调 、 编 解码 等 数字 信号 处 理 ， 与 USRP 配套 使 用 ， 可 快速 构建 无 线 通信 原理 验证 系统 。 该 
系统 通过 优化 数据 存储 算法 ， 最 高 可 支持 50MHz 瞬时 带宽 信号 的 分 钟 级 无 损 保存 ， 并 可 在 预 设 频 率 集 上 自 


动 扫 频 存 储 。 
多 "时 全 | PCH | USRP 频 谱 采 集 模块 
Gnuradio 频 谱 采集 软件 
图 5 高 速 频谱 采集 系统 
本 文 的 所 有 训练 数据 和 测试 数据 均 来 自 该 平台 的 实地 频谱 采样 。 采 样 速率 为 40Msps， 单 频 点 采样 时 长 
约 5 秒 , 采样 地 点 包括 北京 中 关 村 地 区 、 天 津 滨海 新 区 、 天 津 渤海 湾 三 地 共 7 个 点 位 ， 关 注 信号 为 中 国 大 陆 
常见 2G/3G/4G 蜂 负 下 行 信号 12 种 ， 在 包含 关注 信号 的 频段 内 ， 每 偏 移 10MHz 设立 一 个 采样 频 点 ， 共 计 


34 个 频 点 ， 数 据 集 总 大 小 约 为 650GB。 
表 3 是 北京 中 关 村 地 区 三 大 运营 商 2G/3G/4G 蜂窝 下 行 频率 分 配 表 ， 该 表 是 基于 相关 标准 文件 ， 并 利 
用 仪器 实际 测量 观察 后 校对 所 得 。 结 合 北京 、 天 津 等 地 的 实测 结果 ， 发现 该 表 在 中 国 大 陆 境内 并 不 通用 ， 
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运营 商 有 可 能 在 不 同 区 域 按 照 入 网 用 户 的 数量 和 流量 特 生 
同 区 域 、 相 同 频 点 处 的 信号 类 型 可 能 有 所 不 同 。 这 对 本 研究 的 核心 算法 没有 人 


带 来 一 定 麻烦 。 


表 3 北京 地 区 三 大 运营 商 2G/3G /4G 蜂窝 下 行 频率 分 配 表 


E, 在 一 定 条 件 下 自主 调整 频率 资源 的 分 配 , 使 得 不 


E 何 影响 ,但 会 给 数据 标注 工作 


870-885 


频率 范围 (MHz) 信号 名 称 
电信 2G _ CDMA 下 行 


935-955 


移动 2G_GSM900_ 下 行 


955-960 


联通 2G _GSM900 下行 


1805-1820 


移动 2G_GSM1800_ 下 行 


1840-1860 


联通 4G_FDD_ 下 行 


1860-1875 


电信 4G_FDD_ 下 行 


1885-1905 


移动 4G_TD-LTE 


1905-1915 


移动 4G_TD-LTE 


2010-2025 


移动 3G_TD-SCDMA 


2110-2130 


电信 4G_FDD _ 下行 


2130-2135 


联通 3G_ WCDMA 下 行 


2135-2140 


联通 3G WCDMA 下行 


2140-2155 


联通 4G_FDD 下行 


2575-2595 


移动 4G_TD-LTE 


2595-2615 


移动 4G_TD-LTE 


2615-2635 


移动 4G_TD-LTE 


4.2 数据 预 处 理 与 标注 


原始 数据 的 格式 为 时 域 I/Q 采样 ， 必 须 先 转换 为 频谱 瀑布 图 ， 才 能 被 RadioYOLO 模型 识别 和 处 理 。 
本 研究 利用 Python 语言 和 相关 第 三 方 库 ， 按 照 3.1 节 的 预 处 理 流程 ， 编 写 了 一 系列 脚本 代码 ， 将 采集 到 的 
650GB 时 域 1/Q 采样 数据 ， 转 变 为 4740 张 512X512 的 灰白 图 片 ， 其 中 训练 集 3792 张 ， 测 试 集 948 张 。 

之 后 ， 需 要 对 训练 和 测试 样本 进行 标注 。 数 据 标注 本 是 一 项 繁琐 的 人 力 劳 动 , 但 是 我 们 基于 本 数据 集 内 
待 识 别 信号 具有 固定 工作 频段 且 持续 存在 的 特点 , 设计 了 一 种 半自动 的 数据 标注 方法 , 大 大 降低 了 重复 性 工 


作 。 该 方法 先 在 每 个 点 位 、 每 个 频 点 上 挑选 2 张 频谱 图 i 


行人 工 标注 ， 然 后 对 该 点 位 、 该 频 点 上 剩余 的 频谱 


图 进行 软件 自动 化 标注 ， 其 标注 坐标 在 两 张 人 工 标注 的 坐标 范围 内 随机 抖动 。 标 注 示 例如 图 6 所 示 ， 在 以 


2140MHz 为 中 心 的 40MHz 范围 内 ， 共 存在 1 个 电信 4G_FDD 和 下行 信号 〈 部 分 可 见 )、2 个 联通 


3G_WCDMA _ 下行 信号 和 1 个 联通 4G_FDD 和 下行 信号 ， 通 过 标注 可 视 化 边框 ， 软 件 按 一 定格 式 自 动 在 


L 


后 台 生 成 该 图 片 的 文本 标注 信息 。 


图 


值得 一 提 的 是 , 虽然 本 研究 中 数据 的 采集 和 标注 都 基于 频率 , 而 对 于 2G/3G/4G 蜂 负 等 授权 通信 系统 ， 
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直接 利用 频率 信息 就 几乎 可 以 完成 信号 识别 ， 但 这 并 不 具备 通用 性 ， 且 无 法 完成 核心 技术 的 验证 。 因 此 , 我 
们 在 模型 训练 和 检测 时 ,刻意 回避 了 中 心 频率 信息 ， 只 对 接收 机 通 带 内 的 数字 基带 信号 进行 处 理 。 这 也 意味 
着 ， 即 使 某 信和 号 被 调谐 到 未 知 的 非 授权 频段 内 ， 也 不 会 影响 本 算法 的 检测 结果 。 


5 结果 与 分 析 

为 了 验证 算法 性 能 , 我们 在 Tensorflow 框架 下 ,利用 Python 语言 实现 了 RadioYOLO 模型 ， 以 及 整个 
RadioImageDet 算法 ， 并 进行 模型 训练 与 测试 。 数 据 集 来 自 预 处 理 后 的 真实 频谱 数据 ， 共 包含 12 种 信和 号， 
其 中 训练 样本 3792 个 ， 测 试 样本 948 个 ， 具 体 数 据 特 征 详 见 第 3 章 。 模 型 训练 时 ， 我 们 对 训练 集 的 前 80% 
进行 训练 ， 后 20% 用 于 训练 过 程 中 的 模型 验证 。 模 型 训练 优化 器 采用 adam 算法 ， 轮 次 (epoch) 上 限 设 为 
50， 批 大 小 (batch_size)〉 设 为 8。 从 实际 运行 结果 来 看 ， 在 采用 NVIDA GTX1060T 显卡 加 速 的 条 件 下 ， 
训练 速度 约 为 600 毫秒 /batch, 每 轮 耗 时 约 为 230 秒 。 单个 样本 的 测试 速度 约 为 33 毫秒 , 检测 帧 速 为 30 帧 
/ 秒 ， 基 本 满足 实时 应 用 需求 。 

识别 结果 的 输出 如 图 7 所 示 。 模 型 软件 会 根据 识别 的 结果 ， 自 动 在 原 图 上 进行 标 框 ， 并 注 明 信和 号 类 型 和 
识别 置信 度 。 由 图 可 见 ， 某 些 信号 在 频谱 瀑布 图 上 的 特征 非常 明显 ， 通 过 人 有 眼 可 以 轻易 判决 ， 这 是 我 们 开展 
本 研究 的 基本 前 提 和 动机 。 从 检测 结果 上 看 ， 人 眼 能 够 轻易 识别 的 信号 ,在 绝 大 多 数 情况 下 该 算法 模型 也 能 
正确 识别 ， 但 也 有 一 些 例外 ， 如 图 7-(g)。 而 人 有 眼 不 易 识 别 的 信号 ， 算 法 模型 出 错 的 概率 更 高 ， 如 网 7-(b)， 
但 某 些 情况 下 也 能 正确 识别 ， 如 图 7-(e)。 这 些 现象 都 直观 证 明了 利用 图 像 深 度 学 习 方 法 进行 无 线 电信 和 号 识 
别 的 可 行 性 和 有 效 性 ! 


(a) 870MHz (9) (b) 940MHz (X) (c) 1820MHz (V) 


(e) 2030MHz (y) (f) 2140MHz (9) (g) 2150MHz (X) (h) 2590MHz (V) 


图 7 模型 测试 结果 样本 

为 了 更 严谨 的 评估 算法 的 性 能 ,我 们 需要 更 多 的 量化 指标 。 如 图 8 所 示 ， 对 于 二 分 类 问题 ,根据 真实 值 
和 预测 值 的 结果 ， 可 以 将 整个 样本 集 分 为 4 个 象限 ， 如 图 中 灰色 部 分 所 示 ， 分 别 是 真正 例 “TP)、 伪 正 例 
(FP)、 真 反例 TN)〉 和 伪 反 例 “FN)。 经 过 简单 扩展 ， 二 分 类 混淆 矩阵 (confusion matrix) 也 可 以 变 成 
多 分 类 混淆 矩 阵 。 基 于 混淆 矩阵 ， 可 以 构造 多 种 分 类 器 性 能 评价 指标 。 
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正确 率 (accuracy) 
样本 数 占 总 样本 数 的 比 伪 


预测 结果 


Yes No 总 计 
实 Yes TP FN P 实际 正 例 ) 
际 
结 
果 No FP TN N《〈 实 际 反例 ) 


总 计 P” (预测 正 例 ) ”N’” (预测 反例 》 
图 8 二 分 类 问题 的 混 清和 矩阵 
是 最 常见 的 评价 指标 ， 其 定义 公式 为 accuracy = (TP+TN)/(P+N)， 即 被 分 对 的 
|。 通常 来 说 ， 正 确 率 越 高 ,分 类 器 越 好 。 图 9 是 本 模型 测试 结果 的 混淆 和 矩阵， 其 中 


纵 轴 表 示 真 实 标签 , 横 轴 


表示 预测 标签 , 在 12X12 的 坐标 内 , 用 方 框 颜色 表示 数值 , 颜色 越 深 、 数值 越 大 。 


一 般 而 言 ， 混 淆 矩阵 对 角 线 的 颜色 越 深 越 好 ， 其 它 坐 标点 的 颜色 越 浅 越 好 。 由 图 可 见 ， 模 型 对 于 大 部 分 信和 号 


识别 性 能 很 好 ， 但 


是 容易 将 Uni4G_DL_FDD1800 和 Uni4G_DL FDD2100 分 别 识 别 成 


Tele4G_DL_FDD2100 和 Tele4G_DL_FDD2100。 根据 混 请 矩阵 和 定义 公式 ,可 以 算出 该 模型 的 识别 正确 


率 为 86.04%。 


Confusion Matrix (overall accuracy is 0.8604) 


Tele2G_DL_ CDMA 


Mobi2G_DL_GSM900 ] 
Uni2G_DL_GSM900 ] 
Mobi2G_DL_GSM1800 ] 
Uni3G_DL_ WCDMA ] 
Mobi3G_TDSCDMA -| 
Uni4G_DL_FDD1800 | 


True label 


Uni4G_DL_FDD2100 1 
Tele4G_DL_FDD1800 ] 
Tele4G_DL_FDD2100 -| 

Mobi4G_TDLTE_20M -| 


Mobi4G_TDLTE_10M -| 


0.0 


Predicted labe 


图 9 测试 结果 -12 类 信号 识别 的 混淆 矩阵 


正确 率 虽 然 是 一 个 很 直观 的 评价 指标 , 但 是 有 时 候 并 不 能 完全 反映 一 个 算法 的 好 坏 , 特别 是 在 样本 数据 


分 布 不 均衡 时 尤为 明显 ， 
Recall ) 曲线 ， 其 中 纵 


因此 我 们 又 引入 了 功能 更 强大 的 PR 曲线 。PR 曲线 ， 即 查 准 率 - 查 全 率 (Precision- 
坐标 为 Precision， 横 坐标 为 Recall。Precision 又 称 精准 率 ， 其 定义 公式 为 


precision=TP/(TP+EP)， 表 示 被 分 为 正 例 的 示例 中 实际 为 正 例 的 比例 ,Recall 又 称 召 回 率 ， 其 定义 公式 为 
recall=TP/(TP+EN)， 表 示 所 有 正 例 中 被 分 对 的 比例 。PR 曲线 可 以 直观 展示 分 类 效果 的 好 坏 ， 在 分 类 、 检 
索 等 领域 应 用 广泛 ， 一 般 而 言 ， 曲 线 越 靠近 坐标 “1，1)， 分 类 器 性 能 越 好 。 

但 是 ,PR 曲线 毕竟 是 一 个 向 量 ,不 方便 进行 数值 比较 ,因此 我 们 通常 使 用 平均 碍 准 率 (Average-Precision， 
AP)， 即 PR 曲线 下 的 面积 进行 分 类 效果 评估 。 对 于 一 个 分 类 器 而 言 ， 往 往 能 够 同时 识别 多 个 目标 ， 而 一 条 


PR 曲线 及 其 AP 值 只 能 表示 其 中 一 种 目标 的 分 类 效果 , 因此 , 可 以 再 对 所 有 AP 值 求 平均 ， 就 得 到 了 mAP 
值 。 目 前 ，mAP 值 已 经 成 为 检测 算法 的 核心 性 能 指标 之 一 。 


201809.00001v1 


chinaXiv 


图 10 是 本 模型 测试 结果 的 PR 曲线 图 ， 表 5 是 其 对 应 的 AP 值 。 从 


Precision 


PR curves (mAP = 0.7772) 


一 Tele2G_ DL_CDMA 
一 Mobi2G_DL_GSM900 
一 Uni2G_DL GSM900 
— Mobi2G_DL_GSM1800 
一 Uni3G_DL_ WCDMA 
— Mobi3G_TDSCDMA 
-一 Uni4G_DL FDD1800 
— Uni4G_DL_FDD2100 
— Tele4G_DL_FDD1800 
一 Tele4G_DL FDD2100 
— Mobi4G_TDLTE_20M 
一 Mobi4G_TDLTE_10M 


0.0 0.2 0.4 0.6 0.8 1.0 
Recall 


图 10 测试 结果 -12 类 信号 识别 的 PR 曲线 


图 10 可 以 看 出 ， 尽 管 


A 
‘EE? 
二 


Uni4G_DL_FDD1800 和 Uni4G_DL_FDD2100 的 识别 精准 度 很 高 ， 均 在 90% 以 上 ， 但 由 于 其 召回 率 较 


低 ， 分 别 约 为 30% 和 60%， 


60 吕 ， 也 就 是 说 ， 该 分 类 器 能 够 把 所 有 的 Tele4G_DL_FDD2100 信号 都 检测 
况 。Mobi3G_TDSCDMA 的 情况 则 兼 具 二 


全 已 日 


因此 整体 的 AP 值 指标 并 不 太 好 ， 分 别 只 有 26.02 和 58.50。 换 句 话说 ， 如 果 该 
分 类 器 判定 一 个 信号 是 Uni4G DL FDD1800 或 Uni4G _ DL FDD2100, 则 很 可 


能 是 对 的 , 但 也 会 出 现 很 
多 漏 检 情 况 。Tele4G_DL_FDD2100 的 情况 刚好 相反 ， 其 召回 率 可 达到 100%%， 但 精准 度 不 高 ， 只 有 不 到 


的 特征 ， 


来 ,人 


也 会 出 现 很 多 误 判 情 
召回 率 和 精准 度 都 一 般 ， 整 体 识别 效果 也 比较 一 般 。 


除了 这 4 种 信号 以 外 ， 其 它 8 种 信号 的 识别 效果 都 比较 好 ， 某 些 信 号 的 AP 值 甚至 达到 95 以 上 。 所 有 信号 
识别 的 平均 AP 值 mAP 达到 77.72, 该 指标 非常 接近 目前 在 自然 图 像 目 标 检测 领域 的 最 好 指标 一 一 78.85。 


6 结束 语 


表 5 测试 结果 -AP 值 


序号 信号 名 称 AP 值 
1 Tele2G DL CDMA 97.67 
2 Mobi2G DL GSM900 95.35 
3 Uni2G_ DL GSM900 92.31 
4 Mobi2G DL GSMI1800 93.02 
5 Uni3G_DL_ WCDMA 100 
6 Mobi3G_TDSCDMA 45.76 
7 Uni4G_DL_FDD1800 26.02 
8 Uni4G_DL_FDD2100 58.50 
9 TeleAG DL FDD1800 85.09 
10 | TeleAG DL FDD2100 55.02 

11 | Mobi4G TDLTE 20M 83.91 
12 | Mobi4G TDLTE 10M 99.92 
mAP 77.72 


无 线 电 信号 识别 技术 作为 无 线 通信 的 一 个 重要 研究 领域 , 在 军事 电子 战 、 政 府 频谱 监管 、 商 业 频 谱 共享 


接 入 等 方面 应 用 广泛 。 结合 其 


作为 一 种 “模式 识别 ”任务 的 本 质 ， 以 及 人 工 智能 在 模式 识别 人 有 
势 ， 本 文 提出 了 一 种 基于 图 像 深 度 学 习 的 无 线 电信 号 识别 算法 


I 用 


E 务 中 特有 的 优 
RadioImageDet 算法 。 该 算法 首先 不 


传统 数字 信号 处 理 方法 ， 将 I/Q 采样 数据 流 变换 为 一 张 二 维 频谱 瀑布 图 ， 将 无 线 电 信号 识别 问题 转化 为 图 


像 识别 领域 的 目标 检测 问题 ， 进 而 利用 人 工 智能 在 图 像 识别 领域 的 先进 成 果 ， 以 YOLOvV2 模型 为 基础 ， 构 
造 了 一 种 面向 无 线 电 信号 识别 的 端 到 端 深 度 神经 网 络 模型 一 一 RadioYOLO 模型 , 并 利用 该 模型 识别 信号 的 
波形 类 型 和 时 / 频 坐标 。 这 种 将 无 线 电 信和 号 识别 问题 转化 为 图 像 目 标 检 测 问题 的 思路 ， 在 国内 外 尚 属 首次 提 


出 ， 


给 未 来 复杂 电磁 环境 下 智能 化 无 线 电 信号 识别 技术 的 研究 ， 开 启 了 一 条 新 思路 。 
为 了 检验 算法 的 真实 性 能 ， 本 研究 基于 GnuRadio 和 USRP 平台 ， 开 发 了 一 套 高 速 频谱 采集 系统 ， 并 


在 北京 、 天 津 等 地 实地 采集 频谱 数据 ,构建 无 线 电 数据 集 。 试 验 结果 表明 ，RadioImageDet 算法 能 有 效 识别 


A 


具象 化 后 的 无 线 电信 号 ， 识 别 效果 与 人 眼 近 似 ， 在 实地 采集 的 12 种 、4740 个 样本 的 数据 集中 ， 识 别 准确 度 
达到 86.03%, mAP 值 达 到 77.72, 检测 时 间 在 中 等 配置 的 桌面 计算 机 上 仅 需 33 毫秒 ,充分 验证 了 思路 的 可 
行 性 和 算法 的 有 效 性 。 


RadioImageDet 算法 只 是 基于 图 像 深 度 学 习 的 无 线 电 信号 识别 技术 思路 的 第 一 次 初步 尝试 ， 从 试验 结 


果 ! 
的 刘 
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也 能 看 出 一 些 不 如 人 意 之 处 。 未 来 , 我 们 将 进一步 研究 其 它 信 号 具象 化 方法 和 更 加 适合 无 线 电 信号 特征 


经 网 络 模 型 。 
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